پرش به محتوا

متن دوسویه

از ویکی‌پدیا، دانشنامهٔ آزاد

متن دوسویه (به انگلیسی: Bidirectional text) به متنی گفته می‌شود که شامل هر دو جهت نگارش باشد، یعنی هم راست‌به‌چپ باشد و هم چپ‌به‌راست. چنین متنی معمولاً دارای گونه‌های مختلف الفبا است، اما ممکن است بوستروفیدن (به انگلیسی: Boustrophedon) نیز باشد.

برخی سامانه‌های نوشتاری جهان از جمله الفبای فارسی، خط عربی و الفبای عبری، به شکل راست به چپ نوشته می‌شوند که در آن‌ها نوشته‌ها در سمت راست صفحه‌ها آغاز می‌گردند و در سمت چپ پایان می‌یابند و از این جهت با اکثر زبان‌های جهان که چپ‌به‌راست هستند متفاوتند. هنگامی که متن راست‌به‌چپ با متن چپ‌به‌راست در یک بند ترکیب شوند (مثلا یک متن فارسی با یک متن انگلیسی)، هر کدامشان با جهت خودشان نوشته خواهند شد که به چنین متنی متن دوسویه می‌گویند.

بسیاری از برنامه‌های رایانه‌ای نمی‌توانند متن دوسویه را به درستی نمایش دهند. برای نمونه، نام سارا در عبری (שרה) از راست به چپ به صورت شین (ש) رِش (ר) هه (ה) هجی می‌شود اما برخی مرورگرهای وب ممکن است این متن عبری را برعکس نمایش دهند.

پشتیبانی یونیکد

[ویرایش]

پشتیبانی از متن دوسویه به توانایی یک برنامهٔ رایانه‌ای در نمایش درست متن دوسویه گفته می‌شود.

رایانه‌های نخستین تنها برای پشتیبانی از یک نوع خط طراحی شده بودند که معمولاً چپ‌به‌راست و تنها بر مبنای الفبای لاتین بود. افزودن کدبندی‌های نویسهٔ تازه، موجب شد برخی از خط‌های چپ‌به‌راست دیگر نیز پشتیبانی شوند، اما از نوشتارهای راست‌به‌چپ مانند فارسی یا عبری به این سادگی پشتیبانی نمی‌شد و ترکیب اینگونه نوشتارها عملی نبود. نوشتارهای راست‌به‌چپ نخستین بار در کدبندی‌هایی مانند ایزو/آی‌ئی‌سی ۸۸۵۹-۶ و ایزو/آی‌ئی‌سی ۸۸۵۹-۸ معرفی شدند که حروف را معمولاً به همان ترتیب خواندن و نوشتن ذخیره می‌کردند.

برعکس‌کردن ترتیب نمایش کاراکترهای چپ‌به‌راست که به راست‌به‌چپ شدن آن‌ها منجر می‌شود به سادگی امکان‌پذیر است، اما چنین کاری به قیمت ناتوانی در نمایش صحیح نوشتارهای چپ‌به‌راست (لاتین) تمام خواهد شد. با پشتیبانی از متن دوسویه، امکان ترکیب نوشتارهای گوناگون در یک صفحه، بدون توجه به سوی نوشتاریشان، فراهم آمده. به ویژه استاندارد یونیکد که مبانی پشتیبانی کامل از متن دوسویه را فراهم می‌آورد و قوانین مشخصی برای کدبندی و نمایش ترکیب نوشتارهای چپ‌به‌راست و راست‌به‌چپ دارد.

در کدبندی یونیکد، تمام نویسه‌ها به جز نشانه‌های سجاوندی، به ترتیبی که نوشته می‌شوند ذخیره می‌گردند. این یعنی سوی نوشتن نویسه‌ها در داخل خودشان ذخیره می‌شود. در چنین مواردی، نویسه را نویسهٔ قوی می‌گویند. با این حال، نشانه‌های سجاوندی ممکن است هم در نوشتارهای چپ‌به‌راست نمایان شوند و هم راست‌به‌چپ؛ به این نویسه‌ها، نویسه‌های ضعیف می‌گویند زیرا شامل هیچگونه اطلاعاتی در مورد جهت‌شان نیستند و تصمیم‌گیری در مورد جهت آن‌ها بر عهدهٔ نرم‌افزار خواهد بود. گاهی اوقات بر اثر اشتباه در الگوریتمی که برای تشخیص جهت نویسه‌های ضعیف به کار می‌رود، شاهد خطاهایی در نمایش هستیم. این الگوریتم‌ها جهت نویسه‌های ضعیف را با توجه به نویسه‌های قوی چپ‌به‌راست و راست‌به‌چپ تعیین می‌کنند. در این الگوریتم‌ها هر بخش از نویسه‌های به‌هم‌پیوستهٔ قوی را یک ران (به انگلیسی: run) می‌گویند. یک نویسهٔ ضعیف که بین دو نویسهٔ قوی هم‌سو جای بگیرد، جهت آن‌ها را به ارث خواهد برد. نویسهٔ ضعیفی که بین دو نویسهٔ قوی با سوهای متفاوت جای داشته باشد، سوی نوشتار اصلی را به ارث خواهد برد (در یک سند راست‌به‌چپ، این نویسه راست‌به‌چپ خواهد شد و در یک سند چپ‌به‌راست، چپ‌به‌راست). اگر پس از یک نویسهٔ ضعیف، نویسهٔ ضعیف دیگری وجود داشته باشد، الگوریتم به دنبال نخستین نویسهٔ قوی همسایه خواهد گشت. این روند گاهی منجر به خطاهای ناخواسته در نمایش می‌شود. می‌توان با نویسه‌های شبه‌قوی جلوی چنین خطاهایی را گرفت. به این نویسه‌های شبه‌قوی در نویسه‌های کنترلی یونیکد، نشانه (به انگلیسی: mark) گفته می‌شود. از نشانه‌های U+200E (نشانهٔ چپ‌به‌راست) (اچ‌تی‌ام‌ال: ‎ ‎ LRM) یا U+200F (نشانهٔ راست‌به‌چپ) (اچ‌تی‌ام‌ال: ‏ ‏ RLM) می‌توان در کنار نویسهٔ ضعیف محصورشده استفاده کرد تا سوی نوشتاری آن‌ها را به ارث برد.

برای نمونه، برای نمایش صحیح U+2122 (نماد نشان تجاری) در کنار یک نمانامِ انگلیسی (چپ‌به‌راست) در یک متن عربی (راست‌به‌چپ)، اگر از پس نماد نشان تجاری یک نویسهٔ چپ‌به‌راست نیامده‌باشد، یک نشانهٔ LRM را پس از نماد می‌گذارند. اگر LRM افزوده نشود، نویسهٔ ضعیف در همسایگی یک نویسهٔ قوی چب‌به‌راست و یک نویسهٔ قوی راست‌به‌چپ جای خواهد گرفت؛ از آنجایی که در یک متن چپ‌به‌راست هستیم، این نویسه هم راست‌به‌چپ تصور می‌شود و به صورت نادرستی نمایش می‌یابد.

سامانه‌های نوشتاری که از متن دوسویه استفاده می‌کنند

[ویرایش]

برخی سامانه‌های نوشتاری را می‌توان از هر دو سو نوشت.

بوستروفیدن، هیروگلیف مصری و حروف چینی از این گونه‌اند.

نگارخانه

[ویرایش]

جستارهای وابسته

[ویرایش]

منابع

[ویرایش]